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摘 要 : ARRA AHED (NMF) 可 解释 性 的 同时 ， 提 高 潜在 特征 的 语义 独立 性 是 一 个 开放 的 研究 问题 。 为 了 
防止 特征 的 共 适 应 性 ， 提 出 利用 余弦 相似 度 来 减少 潜在 特征 之 间 的 相关 性 ， 从 而 提高 NMF 的 独立 特征 学 习 能 
为 了 使 得 分 解 后 的 矩阵 具有 较 好 的 稀疏 性 ， 提 出 在 传统 NMF 模型 中 引入 Luo 稀 朴 约束 ， 增 强 了 算法 的 局 部 
习 能 力 和 稳健 性 。 因 此 ， 潜 在 特征 中 的 语义 信息 更 加 明显 ， 潜 在 空间 的 表示 更 具有 判别 性 。 在 fetch_20newsgroups 
BALA RENI UAE 提出 的 INME 算法 在 一 系列 评价 指标 上 效果 都 优 于 传统 的 NMF、SNME 等 算 
法 模型 。 
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Sparse non-negative matrix factorization algorithm for independent feature learning 


Huang Weichun?, Zhao Yang?*, Xiong Liyan? 
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China) 


Abstract: It's an open research problem to improve the semantic independence of potential features while maintaining the 
interpretability of non-negative matrix decomposition (NMF) . To prevent the co-adaptability of features, cosine similarity is 
proposed to reduce the correlation between potential features so as to improve the independent feature learning ability of 
NMF. In addition, in order to make the decomposed matrix have better Sparsity， sparse constraint is introduced into 
the traditional NMF model to enhance the local learning ability and robustness of the algorithm. Therefore, the semantic 
information in the latent features is more obvious, and the representation of the potential space is more discriminative. The 
experimental results of document clustering on fetch 20newsgroups dataset show that the proposed INMF algorithm is 
superior to the traditional NMF and SNMF algorithm models in a series of evaluation indexes. 
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和 矩阵 列 向 量 施加 La Ej Lo 范 数 稀疏 约束 ,首先 挖掘 嵌入 在 高 维 


0 引言 数据 中 的 低 维 数据 结构 ,实现 高 维 数据 的 低 维 表示 ; 然后 利用 
NMF 的 目的 是 将 原始 高 维 数据 矩阵 分 解 为 两 个 低 维 数 。” 在 低 维 数据 聚 类 中 性 能 良好 的 K-Means 算法 对 稀 琉 降 维 后 的 
C ” 据 和 矩阵 ， 并 且 两 个 低 维 数据 矩阵 的 乘积 尽 可 能 地 近似 原始 高 ”数据 进行 聚 类 ， 孙 静 等 人 与 提出 一 种 基于 特征 融合 的 多 约束 


E us i 年。 非 负 矩阵 分 解 算法 。 该 算法 不 仅 考虑 了 少量 已 知 样本 的 标签 

—^ BU BE X -Duxcsxw]e RP", NMF 寻求 。 信息 和 稀 琉 约束 ， 还 对 其 进行 了 图 正则 化 处 理 ， 而 且 将 分 解 
Tix ponen U -[uanscu]e RAT 和 非 负 系数 矩阵 JE ILRCR AI ARRE ERRIENT JB. AA T 
V-evw]eR9", Eh K ROBCYGETYEBUTRAE. ETUS ”法 的 聚 类 性 能 和 有 效 性 。 
然而 潜在 特征 之 间 的 先天 相关 性 使 得 传统 的 NME 算法 


成 等 效 的 矢量 公式 羽 “ 了 mW。 通常 情况 下 ,有 <<min(M4N) 缺乏 状 别 力 ， 并 且 增加 了 最 小 化 损失 函数 的 困难 。 此 外 ， 传 
用 来 降 维 ，v 是 立 列 上 的 原始 数据 向 量 ”的 权重 系数 。 NME 统 的 NMF 算法 没有 充分 利用 矩阵 的 稀 朴 性 ， 并 且 忽略 了 不 
将 数据 矩阵 分 解 为 基本 的 线性 组 合 向 量 。 同 特征 之 间 的 相关 性 的 有 用 信息 。 

很 多 研究 学 者 尝试 采用 不 同 的 代价 函数 来 衡量 NMF 的 稀疏 特征 选择 由 在 应 用 各 种 稀疏 模型 来 实现 特征 选择 并 
性 能 ， 他 们 的 研究 重点 都 是 找到 使 得 该 损失 函数 可 以 取得 最 。“” 实 现 数据 的 稀疏 表示 .许多 研究 5- 已 经 将 范 数 扩展 到 已 
小 值 的 因子 矩阵 (U,V) 。 目 前 ， 很 多 研究 人 员 已 经 提出 了 一 范 数 (0<p<1) 以 获得 更 好 的 稀疏 性 。 在 文献 [18.19] 中 ， 徐 等 
些 方法 来 改进 NME, 如 基于 Fisher 判别 分 析 的 增 量 式 非 负 矩 ”人 已 经 得 出 结论 ， 当 p 为 /2 NS. Logo BD b 范 数 具 有 最 
阵 分 解 算法 中 基于 Hessian 正则 化 的 多 视图 联合 非 负 和 矩阵 分 。 好 的 稀 朴 性 。 在 文献 [20] 中 ，Nie 等 人 已 经 引入 了 联合 己 范 
解 算 法 外、 稀 玖 约束 图 正则 非 负 矩阵 分 解 的 增 量 学 习 算 法 中 。 数 最 小 化 的 损失 函数 和 正则 化 的 特征 选择 。 然 而 5 范 数 不 具 
等 。 韩 素 青 等 人 中 提出 一 种 通过 在 非 负 和 矩阵 分 解 过 程 中 对 基 。 备 很 好 的 稀 政 性 , 因为 它 是 基于 4 范 数 。 最 近 , Wang 等 人 D 
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提出 了 将 己 范 数 扩展 到 已, 矩阵 范 数 (0<p<D 的 思想 ， 以 便 21 BFS ES SEDE ER ESAE ER 
选择 联合 的 、 更 稀 朴 的 特征 , 同时 该 模型 比 b 范 数 具 有 更 好 NMF 可 以 表示 为 线性 神经 网 络 ， 因 为 输入 由 U 中 的 
的 鲁 棒 性 。 实 验证 明 ， 当 p 等 于 1/2 时 ，Ls 和 矩阵 范 数 具有 最 — 基 向 量 的 线性 组 合 表示 : 
好 的 性 能 ， 因 此 本 文 将 bw 矩阵 范 数 模型 应 用 于 的 新 NMF "NUN m 
以 实现 稀疏 约束 。 PUDE 
在 本 文中 提出 利用 余弦 相似 度 来 减少 潜在 特征 之 间 的 相 其 中 ，w 是 第 k 个 潜在 特征 。 
关 性 ， 从 而 提高 NMF 的 独立 特征 学 习 能 力 。 此 外 ， 本 文 引 AIN ENT naa 
AT co BAIRE INMF d. B EAEN MESU 和 
息 更 加 清晰 ， 潜 在 空间 中 的 表示 更 具 判别 力 。 林 文 将 这 些 方 更 新 停止 在 鞍点 处 的 状态 ， 其 中 工 仍然 可 以 进一步 优化 , 直 
ee 到 达到 最 大 迭代 。 研 究 人 员 试 图 在 同一 数据 集 上 通过 在 不 同 
了 本 文 算法 和 传统 算法 在 真实 数据 集 上 的 实验 结果 对 比 。 本 ”的 初始 化 策略 下 执行 改进 的 NMF 来 吕 免 共 适 应 ， 这 带 来 了 
文 工 作 的 主要 贡献 可 以 总 结 如 下 ; 很 大 的 计算 复杂 性 na。 因此 ， 本 文 提出 了 一 种 新 的 NMF, 
a) 本 文 提出 的 INME 通过 引入 余弦 相似 性 防止 特征 共 适 “在 每 次 迭代 中 ， 通 过 最 小 化 潜在 特征 之 间 的 余弦 相似 度 ， 忆 
应 ， 从 而 改进 NMEF; 将 被 独立 更 新 ， 潜 在 特征 将 逐渐 不 相关 。 
b) 在 特征 空间 的 基本 和 矩 阵 上 添加 Luo 范 数 的 稀疏 约束 ， 2.1.1 AGRAR 
不 仅 可 以 实现 数据 的 稀疏 表示 ， 简 化 计算 ， 还 可 以 提高 算法 虽然 NMF 可 以 降低 原始 数据 的 维 数 ， 但 如 何 选择 判别 
的 局 部 学 习 能 力 和 和 鲁 棒 性 。 特征 和 实现 数据 的 稀疏 表示 仍然 是 复杂 的 。 因 此 ， 5 范 数 
T ent EVER SU EAS KORR I ERE UE. 它 可 以 
人 们 从 不 同 的 角度 对 NMF 进行 了 改进 研究 ， 如 约束 " 1573 5 
NMEFI6-99、 结 构 化 NMEF0010 和 广义 NMEU2-HI, fre mz 人 
3E NMF 是 稀疏 NMEF, 稀疏 性 约束 有 助 于 改进 分 解 的 唯一 性 ， 2.1.2 余弦 相似 性 度量 
以 及 得 到 基于 局 部 的 表示 ， 通 常 通过 4 范 数 的 来 实现 特征 先 Theodoridis 等 人 四 将 余弦 相似 性 度量 定义 为 
择 和 数据 的 稀疏 表示 。 正 交 NMF 具有 良好 的 性 能 ， 因 为 正 5 = a" 
交 NMF 的 结果 对 应 于 一 个 独特 的 解 区 域 中 的 稀疏 区 域 ， 它 。 o apr UPS Me NE Ibl -q2uy; 分 别 
学 习 得 最 明显 。 图 正则 化 NMF (GRNMEF) 提高 了 文档 和 是 矢量 + 和 y 的 长 度 ; RE HBRU, BTATREUE 
图 像 等 谷类 任务 中 的 性 能 ， 它 通过 在 散布 的 数据 点 上 构建 最 。 WOMEROEDAIHT HORIS EG ELS. MARI BUS Too 
近 的 邻 域 图 来 模拟 流 形 结构 (S91。 公式 加 权 是 学 习 算 法 的 常用 PME RRR, 
改进 方法 , 可 以 用 来 强调 不 同 成 分 的 相对 重要 性 。 加 权 NMF 2.1.3 迭代 更 新 规则 
在 协同 过 滤 和 又 类 任务 中 很 流行 ， 因 为 它们 根据 实例 的 连接 考虑 到 上 述 因素 ， 本 文 将 独立 特征 学 习 的 稀 玻 非 负 矩阵 
将 先 验 知识 合并 到 损失 函数 中 Hoal。 对 于 具有 复杂 和 异 构 信 分 解 的 目标 函数 定义 如 下 ， 
息 源 的 任务 ， 提 Y NMF, Semi-NMF 14、 非 负 张 量 ia 
Bk TM L=|X -UV «eqs +a e E, oU) (D 
一 种 特殊 的 方法 dropout NMFÜ?ZISTDLBEPEAENERERRE 。 其 中 ， 9 、a 、8 是 非 负 的 ,它们 可 以 平衡 后 面 几 个 重建 误差 
的 更 新 过 程 来 防止 隐藏 单元 的 相互 适应 。 由 于 固定 的 共同 作 “项 的 权重 ,9 c 是 稀疏 参数 , 8 是 余弦 相似 性 参数 。 
用 被 打破 ， 隐 藏 的 单元 仍然 可 以 从 别人 那里 学 习 ， 但 依赖 性 为 了 优化 这 个 目标 函数 ， 可 以 将 式 (7) 中 的 目标 函数 转 
较 小 。 受 这 些 启 发 ， 本 文 提出 了 一 种 新 的 NMF， 其 通过 最 小 换 如 下 ， 
化 潜在 特征 之 间 的 余弦 相似 性 来 起 作用 。 本 文 发 现 通 过 打破 L-TH(XX) -274XTUV) + Tr (VIUTUV)+ "" 
潜在 特征 之 间 的 相关 性 可 以 改进 NMF。 因 此 ， 在 下 一 章 中 ， a(Tr(V'V)+ A077 (U7QU)+ BTr(U*US 
将 余弦 相似 性 纳入 NMF。 此 外 , 添加 在 系数 矩阵 U 上 的 Lus 、 E 
FEBRE TAPERE H RU PE DOR BRE. 2-|[9j|=R” 是 一 个 对 角 和 矩阵 ,可 以 如 下 计算 对 角 矩 阵 
o ay Q 的 第 i RAER u: | 
NMF 的 目的 是 让 系数 矩阵 U 和 基本 矩阵 V 的 乘积 尽 di Wo a 
能 接近 原始 数据 矩阵 X。NMEF 的 公式 如 下 : 为 了 避免 溢出 ,在 定义 矩阵 Q 时 添加 一 个 足够 小 的 常数 


X =UV" (1) 
应 该 最 小 化 平方 欧 几 里 德 距离 损失 函数 : 
L2|x-UVT|. stU e R^ VER (2) 
在 本 文中 采用 平方 欧 几 里 德 距离 损失 函数 : 
L-|X -UV" |R =tr(X"X)- 3 
2tr(XTUV )+tr(VTUTUV) 9) 
其 中 : MEAE L WARP; rO 代表 矩阵 的 迹 。 梯 度 下 降 算 
ERE SEU D: 
(XV (U7 X),, 
Im $m yr, OO da 


€, DES C82 也 可 以 写成 如 下 形式 : 


HLHH ; 


为 了 获得 基 
L 的 偏 导数 : 


S-[s;] e n** 5 


A 


1 


Me) 


Qu^ TY 
tna | 2g 


(10) 


可 以 计算 矩阵 S 的 元 素 % 如 下 : 


S,-35,es(U.U )) 


ERE U 和 系数 身 


(11) 


ERE V 的 迭代 更 新 规则 , 取 


Chinay i AEH 
l9 hinaXiv& | F HH | | 


CD 
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总 是 FQ 的 辅助 函数 。 
E e 证 明 fF(V) 求 一 阶 导 数 和 二 阶 导数 分 别 是 
= UX &3UUV +20V (13) F'v)-(-2UT X X2UTUV +20V ),. 
"yz T 
基本 矩阵 U 和 系数 矩阵 V BO CECINIT FA: F'(v)-(2U7U +24), 
(XVT) Bir E F(V) 的 泰勒 展开 式 可 以 写成 如 下 形式 : 
Uus U «(UVVT --46QU BUS), a4) F(V)2 F(V:) e F(V*)(V -V*)-(U'U +a) (V -Vy (24) 
vey, X). a B® (UTUV), -E(UTU) ys (UU), v; 
" — "(U'UX aV), 
QV ) -ay 
2.2 收敛 性 分 析 (aV), =V, 
节 将 分 析 算 法 的 收敛 性 , 证 明 式 (7) 中 的 目标 函数 在 有 UUV «oV 、，， 
y Y U+a 
BRESIUR 04) 一 (15) 中 单调 递减 。 pn PM 
Tio NSTRGEGEU SS C145. 的 收敛 性 。 通过 联 立方 程式 (22) 和 (23) , 知道 G(V™,V') 是 式 (23) 
引 理 2.1 261 的 局 部 极 小 值 ， 并 且 Y# 是 相应 的 局 部 最 小 点 。 
| " GQ.V.) J& F (V) 的 辅助 函数 ,因此 F 通过 式 (15) 单 调 递减 。 
» 1/2 gi » 12 8i x 
ler] sx e: =l 09 3 实验 结果 和 分 析 
~ Ale; als; 
2 3.1 数据 集 
证 明 从 引 理 2.1 有 本 文选 择 公开 的 语料库 fetch_20newsgroups 数据 集 进 行 
« wet « lui 实验 。 数 据 集 大 约 收集 了 20 000 份 新 闻 文件 的 集合 ， 可 均匀 
Yd" -Aee Eloi -eel (7) ”地 划分 为 20 个 不 同 的 主题 类 别 。 它 最 初 由 朗 肯 收 集 ， 包 仿 
alui, ajui, 18 846 个 文件 ， 并 且 在 本 文 预 处 理 之 后 仅 保留 1000 个 词 。 
定义 一 个 函数 如 下 每 个 文档 被 转换 为 向 量 *s Re ， 使 得 数据 矩阵 XeReeeon 。 
H(U.V) 2 Tr(X? X)-2Tr(X"UV) - Tr(V'U"UV) (18) 本 文 将 标准 NMF, d NMF (SNMF) 和 本 文 的 新 算法 应 


+a (Tr(VTV))+ Tr (UTUS) 


1/2 


53 |U= 2U: 


1/2 


， 可 以 得 到 以 下 不 等 式 (19) : 


2 


2 2 


m m lu? 2 ym TES m lu: | 
H NT i «dul. «o». lvi ' lur [s 
cuve AUR. Lease oos [IUE Luar 
H pt da «du MED 4l: i lu: 2 
(19) 
结合 式 (15) 和 C180 ， 可 以 得 到 以 下 不 等 式 : 
n«dun sm «Jul. Q0) 
因此 , 式 (6) 中 的 目标 函数 在 迭代 更 新 规则 式 (14) 中 
单调 减少 。 


接 下 来 继续 分 析 和 迭代 更 新 规则 式 〈15) 的 收敛 性 。 
定义 2.1 GQ A^) j& F (h) 的 一 个 辅助 函数 如 果 满 足以 下 
条 件 : 


G(h,h)zF(h) G(hh)-F(h) (21) 
引 理 2.2 如 果 G 是 一 个 辅助 函数 , 那么 FE 在 以 下 更 新 下 


h = "aG (h, hr ) (22) 
显然 能 够 证 明 
F(i*)sG(i,m)sG(v,m)- F() JE B. FO) 是 收敛 的 。 


5| 3i 2.3 


T. 
G(V.V:) - F(V)e F'(V:)(v VI) EY 


(v-v Q3) 


确 度 和 召回 率 。 


用 于 这 个 XxX， 用 于 比较 研究 算法 的 
3.2 实验 设置 
评价 指标 ; 在 本 文中 使 用 三 种 评价 指标 ， 即 准确 度 
(precision )、 召回 率 (recall) 和 下 值 (F-measure)/(Fl-score) 
来 评估 上 述 聚 类 算法 的 聚 类 性 能 。 
公式 如 下 : 


Recall s Peu (25) 
n; 
中 : 族 是 已 知 类 别 i 中 的 文本 属于 聚 类 j PDA n æ 
知 类 别 i 中 的 文档 数 ， 是 聚 类 j 中 的 文档 数 。 
F 值 同 时 考虑 了 上 述 的 文档 聚 类 精度 P 和 召回 率 r 来 计 
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算 其 得 分 ， 它 是 一 种 复合 指标 ， 其 值 越 大 ， 聚 类 效果 越 好 。 
. 2xprecisionx recall 
Aja precision- recall Q6) 


参数 设置 对 于 fetch. 20newsgroups 数据 集 ， 新 的 NMF 
的 参数 w、8 ， 从 区 域 {0.01~0.1} 中 选择 并且 SNMEF 的 正 
则 化 项 的 平衡 参数 a， 与 上 述 相同 。 为 了 验证 不 同 主题 数 
下 算法 的 性 能 ，K 分 别 设置 为 {5,10,15,20}。 本 文 将 INMF 算 
法 与 传统 的 NMF、SNMEF 算法 进行 了 对 比 实验 ,详细 的 实验 
对 比 结果 在 下 节 进 行 分 析 。 
3.3” 聚 类 结果 

表 1~4 显示 了 两 种 基本 方法 与 本 文 的 方法 在 
fetch 20newsgroups 数据 集 上 的 聚 类 结果 比较 ， 对 比 不 同 K 
下 准确 率 、 召 回 率 、Fl-score 指标 。 三 种 方法 中 的 最 佳 表现 
都 是 粗 体 显 示 的 。 它 表明 ,无论 K 的 取 值 为 多 少 ， 本 文 提出 
的 新 方法 均 比 传统 方法 表现 得 更 好 。 它 展示 了 本 文 提出 的 方 
法 在 防止 潜在 特征 共 适 应 的 有 效 性 。 
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Al k=5 数据 集 上 的 结果 
Table 1 Results on k=5 datasets 


TUE Precision Recall Fl-score 
NMF 0.199 0.198 0.198 
SNMF 0.205 0.206 0.206 
INMF 0.223 0.222 0.222 
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K2 k=10 数据 集 上 的 结果 
Table 2 Results on k=10 datasets 


算法 Precision Recall F1-score 
NMF 0.100 0.099 0.099 
SNMF 0.102 0.101 0.101 
INMF 0.109 0.108 0.108 


表 3 k=15 数据 集 上 的 结果 
Table 3 Results on k=15 datasets 


算法 Precision Recall F1-score 
NMF 0.064 0.064 0.064 
SNMF 0.066 0.066 0.066 
INMF 0.089 0.088 0.088 


表 4 k=20 数据 集 上 的 结果 
Table 4 Results on k=20 datasets 


算法 Precision Recall Fl-score 
NMF 0.051 0.051 0.051 
SNMF 0.050 0.049 0.050 
INMF 0.059 0.058 0.058 


图 1-3 直观 地 表明 了 随 着 K 值 的 变化 , 本 文 提 出 的 方法 
INME 与 其 他 两 种 方法 聚 类 结果 的 对 比 ， 分 别 从 准确 度 、 召 
可 率 和 下 值 来 进行 评估 。 

如 图 1p. 24 Kk 分 别 取 5$、10、15、20 Bf, INMF 在 
准确 度 方面 与 传统 NMF, SNME 的 对 比 。 通 过 条 形 图 的 对 比 ， 
可 以 更 加 直观 地 看 到 ， 在 不 同 K 值 下 ， 本 文 的 INMF 算法 的 
准确 度 都 是 要 优 于 其 他 两 种 算法 的 。 
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图 1 各 KK 值 下 NMF、SNMF、INMEF 的 准确 性 对 比 
Fig. 1 Accuracy comparison of NMF, SNMF and 
INMF under each K values 

如 图 2 R, 3k 取 不 同 值 时 ，INME 在 召回 率 方面 与 
传统 NMF, SNMF 的 对 比 。 通 过 条 形 图 的 对 比 ， 可 以 更 加 直 
观 地 看 到 ， 本 文 的 INME 算法 的 召回 率 是 要 优 于 其 他 两 种 算 
法 的 ， 并 且 随 着 K 值得 增 大 优势 更 加 明显 。 

如 图 3 Br. 0 Kk 取 不 同 值 时 ，INME 在 了 值 方面 与 传 
Zi NMF, SNMF 的 对 比 。 通 过 条 形 图 的 对 比 ， 可 以 看 到 本 文 
的 INMF 算法 的 F 值 是 优 于 其 他 两 种 算法 的 ， 但 总 体 表 现 随 
着 K 值得 增 大 而 降低 ,因为 具有 更 多 主题 的 更 大 的 数据 集 对 
于 聚 类 来 说 更 困难 。 
3.4 ”参数 选择 与 收敛 性 分 析 

当 p 分 别 设 为 {0.1，0.3，0.5，0.7，0.9} 时 ， 比 较 了 在 K = 
5 时， 传统 NMEF、SNME 以 及 本 文 算法 在 该 数据 集 上 的 收敛 


曲线 。 在 图 4 中 , 显示 了 当 p 对 应 不 同 值 时 每 种 算法 的 结果 。 
能 和 时 间 消 耗 ， 本 文 设置 了 最 合适 的 参数 。 对 
比分 析 可 以 看 到 ， 所 有 算法 在 20 次 迭代 内 趋 于 收敛 。 在 
fetch_20newsgroups 数据 集 上 , NMF 和 SNMF 的 迭代 次 数 约 
标 函 数 趋 于 稳定 。 但 INMF 可 以 在 15 次 和 迭代 
通过 本 文 作出 的 改进 之 后 ， 每 次 迭代 后 更 
E 变 得 不 相关 的 ， 累 积 的 效果 带 来 了 更 好 的 性 能 。 
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2 4€ KEF NMF, SNMF, INMF 的 召回 率 对 比 
Fig.2 Comparison of recall rates of NMF, SNMF and INMF under 


each K values 
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图 3 4% KIEF NMF, SNMF, INMF 的 F 值 对 比 


Fig.3 Comparison of F-measure of NMF, SNMF and INMF under 


each K values 
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图 4 fetch 20newsgroups E NMF, SNMF 和 INMEF 的 收敛 曲线 
Fig.4 Convergence Curves of NMF, SNMF and INMF on fetch_20 
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本 文 对 传统 NMF 中 潜在 特征 之 间 的 相关 性 对 算法 性 能 
的 影响 进行 了 分 析 ， 提 出 了 独立 特征 学 习 的 稀 朴 非 负 矩 阵 分 
解 方法 即 INMF。 该 方法 不 仅 可 以 利用 向 量 的 余弦 相似 性 ， 
而 且 可 以 有 效 地 学 习 目 标的 局 部 信息 。 在 INMF H, HEI 
征 的 更 新 是 通过 最 小 化 每 次 迭代 中 的 余弦 相似 度 实现 的 。 在 
的 算法 中 有 效 地 防止 了 特征 共 适 应 性 ， 因 此 潜在 
0 明确 和 更 具有 辨别 力 。 此 外 ， ZL WiNA REN 
的 约束 条 件 ， 可 以 使 分 解 后 的 矩阵 
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NMF 中 


cur LL 
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性 ， 增 强 了 算法 的 局 部 学 习 能 力 和 和 鲁 棒 性 。 从 上 面 的 实验 结 
以 得 出 结论 ， 本 文 提 出 的 算法 在 精度 和 召回 率 方面 都 
的 效果 。 未 来 ， 笔 者 将 探索 具有 其 他 损失 函数 和 约束 
FAJ NMF, 并 且 将 提出 的 新 方法 应 用 在 不 同 的 领域 , 如 计 
算 机 视觉 、 语 音 


别 、 网 络 安全 、 生 物 医学 工程 等 。 
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